Contrainte de correspondance Document-Document pour la RI. Application à la Divergence de Kullback-Leibler

نویسندگان

  • Philippe Mulhem
  • Jean-Pierre Chevallet
چکیده

RÉSUMÉ. Cet article décrit une contrainte d’un modèle de recherche d’information décrivant les comportement attendu d’un système si un document du corpus est posé en requête, la contrainte DDMC (Document-Document Matching Constraint). Cette contrainte n’étant pas vérifiée par un modèle classique de recherche d’information (modèle de langue basé sur un calcul de négative de Divergence de Kullback-Leibler avec lissage de Jelinek-Mercer), nous présentons une modification de ce dernier modèle qui permet de vérifier DDMC. Une dernière partie présente des expérimentations menées afin de vérifier que notre modification n’impacte pas la qualité des réponses d’un système, tout en garantissant la vérification de DDMC.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Correspondances compatibles avec les fichiers inverses pour la recherche d'information

RÉSUMÉ. Cet article fait un retour sur l’un des éléments majeurs d’un système de recherche d’information : la correspondance basée sur des fichiers inverses car le passage d’une formule théorique à une implantation compatible avec des fichiers inverse est rarement explicitée dans les publications. Nous proposons ici de définir plus formellement l’expression d’une formule de correspondance compa...

متن کامل

A Document Frequency Constraint for Pseudo-Relevance Feedback Models

RÉSUMÉ. Nous étudions dans cet article le comportement de plusieurs modèles de rétropertinence en mettant en avant leurs principales caractéristiques. Ceci nous conduit à introduire une nouvelle contrainte pour les modèles de rétro-pertinence, contrainte liée à la fréquence documentaire (DF) des mots. Nous analysons ensuite, d’un point de vue théorique, différents modèles de rétro-pertinence pa...

متن کامل

Probability for linguists

This paper offers a gentle introduction to probability for linguists, assuming little or no background beyond what one learns in high school. The most important points that we emphasize are: the conceptual difference between probability and frequency, the use of maximizing probability of an observation by considering different models, and Kullback-Leibler divergence. Nous offrons une introducti...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

Une approche non supervisée pour le typage et la validation d'une réponse à une question en langage naturel : application à la tâche Entity de TREC 2010

Searching for named entities has been the subject of many researches in information retrieval. In this paper, we seek to determine whether a named entity is of a given type and in what extent it is. We propose to address this issue by an unsupervised web oriented language modeling approach. In addition, we want to determine if this new information can be used to improve the ranking of candidate...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015